草庐IT

python - Scrapy SgmlLinkExtractor 问题

全部标签

python - 从 Python 创建 Excel XML 文件

我需要从Python创建ExcelXML文件。ExcelXML格式相当简单。我查看了从Excel2003保存的示例xml文件,它非常简单。我正在寻找一个Pythonic的现成库来创建这样的xml文件,而不是重新创建一个。我可以使用的东西如下:book=Expy.Workbook()s1=book.add_sheet()s1[0,2]="A3"s1[0,0]=12s1[0,9]=Expy.Formula("=Sum(A1:A3)")book.write("excelfile.xml")有人知道类似的东西吗?xlwt似乎过时了,只支持python2.x,而且似乎写的是xls文件,而不是xm

xml - maven 和 xml 解析的 Hibernate 依赖问题

我正在为我们的开发团队编写GWT-Hibernate内部Web应用程序。之前,我编写了工具来解析XML文件,这些文件表示在现场收集的客户配置以供分析。现在,我正在尝试为支持组添加一个UI前端。XML解析代码使用xpath和org.w3c.dom类来使用配置文件,在将UI和解析代码合并到同一个项目后,我遇到了依赖性问题。Hibernate3.5.1依赖于使用旧版本xml-apis的dom4j。xml-apisjar有旧版本的org.w3c.dom类,太旧以至于我在XML解析中使用的方法之一不可用。org.w3c.dom.Node.getTextContext方法在旧的xml-apis类中

c# - 在 SVG 文件中获取 XML 元素时出现问题

我正在尝试读取包含以下内容的非常基本的SVG文件:我正在尝试获取线元素的集合。但是,以下代码不起作用:XDocumentXD=XDocument.Load(PathToFile);XElementSVG_Element=XD.Root;varadam=SVG_Element.Elements("line");检查变量后,文档已正确加载,但变量“adam”仍为空,就好像它没有找到任何具有该名称的元素一样。感谢您的帮助。编辑:使用后代并不能解决这个问题。它仍然是空的。 最佳答案 好的伙计们,我确实弄明白了。显然我需要将命名空间指定为QN

python - 如何注释掉 XML 元素(使用 minidom DOM 实现)

我想注释掉xml文件中的特定XML元素。我可以只删除该元素,但我更愿意将其注释掉,以备日后需要。我目前使用的删除元素的代码如下所示:fromxml.domimportminidomdoc=minidom.parse(myXmlFile)forelementindoc.getElementsByTagName('MyElementName'):ifelement.getAttribute('name')in['AttribName1','AttribName2']:element.parentNode.removeChild(element)f=open(myXmlFile,"w")f.

java - 单个 XSLT 文件能解决这个问题……还是……?

下面是我的XML文件-ABCJava,XSLT,XPATH,XML,Oracle,VB.NETXYZJava,XSLT,XPATH,XML,JSP,HTML下面是XSLT文件-一个简短的版本我使用Java作为前端。为了以HTML格式显示输出,我有一个XSLT文件。该XSLT文件是标准文件,即;它显示所有的简历。现在我要做的是使用包含所有候选人姓名的列表框,当单击特定姓名时,只应显示他的简历。我已经对Java部分进行了编码,以将候选人的姓名显示到ListBox中。现在在以HTML格式显示所选候选人的简历时遇到一些麻烦。当前XSLT文件正在显示所有CV。那么我是否需要另一个XSLT文件,它

python - 解析带有前缀标签的 .xml? xml.etree.元素树

我可以读取标签,除非有前缀。我没有幸运地搜索SO以查找以前的问题。我需要阅读media:content。我尝试了image=node.find("media:content")。Rss输入:PopularPhotographyinthelast1weekfoophotography/misc...我可以读取兄弟标签title。fromxml.etreeimportElementTreewithopen('cache1.rss','rt')asf:tree=ElementTree.parse(f)fornodeintree.findall('.//channel/item'):title

python - XPath:仅获取具有特定子元素的元素

我有一个文件系统,它以以下格式在xml文档中表示:123directory3...456filesuccess...我需要做的是,使用Python的lxml,只检索表示目录的entry对象。所有条目都包含一个对象,但我需要知道如何检索entry对象列表,其中该对象的文本等于directory。我可以通过几个不方便的步骤来完成此操作,但我宁愿对其进行一次查询。这是我分步进行的方式:#xml_parse.pyns={'ns1':'namespace1','ns2':'namespace2'}fornodeintree.xpath("//ns1:entry",namespaces=ns):i

python - 使用 Python 的 xml.etree 查找元素开始和结束字符偏移

我有如下所示的XML数据:ThecaptialofSouthAfricaisPretoria.我希望能够提取:目前在etree中提供的XML元素。文档的完整纯文本,位于开始和结束标记之间。每个起始元素在纯文本中的位置,作为字符偏移量。(3)是目前最重要的需求;etree提供(1)fine。我看不出有什么方法可以直接做(3),但希望遍历文档树中的元素会返回许多可以重新组合的小字符串,从而提供(2)和(3)。但是,请求根节点的.text仅返回根节点和第一个元素之间的文本,例如“的首都”。用SAX做(1)可能涉及实现很多已经写过很多次的东西,例如迷你王国和etree。使用lxml不是此代码要

java - JAXB 序列化接口(interface)到 XML 问题(Map<String,ISomeInterface> 不工作)

我正在尝试使用JAXB2.2.4将接口(interface)序列化为XML,但是当我在Map对象中有一个接口(interface)时,它会爆炸并给我错误:com.sun.xml.bind.v2.runtime.IllegalAnnotationsException:2countsofIllegalAnnotationExceptionscom.test.IInterface2isaninterface,andJAXBcan'thandleinterfaces.thisproblemisrelatedtothefollowinglocation:atcom.test.IInterface

Python Minidom XML 查询

我正在尝试使用lxml查询此XML:XMLTESTXMLTEST2我写了这段代码:fromlxmlimportetreedoc=etree.parse(file_path)root=etree.Element("lista_tareas")forxinroot:z=x.Element("tarea")foryinz:element_text=y.Element("description").textprintelement_text它不打印任何东西,你能建议我怎么做吗? 最佳答案 您不想使用minidom;使用ElementTree